检索结果

Select

1. 基于特征增强和语义相关性匹配的图像文本检索方法

陈佳, 张鸿

《计算机应用》唯一官方网站 2024, 44 (1): 16-23. DOI: 10.11772/j.issn.1001-9081.2023060766

摘要（239）

HTML （8）

PDF （1434KB）（237）

为实现图像文本检索中图像与文本的精确语义连接，提出一种基于特征增强和语义相关性匹配（FESCM）的图像文本检索方法。首先，通过特征增强表示模块，引入多头自注意力机制增强图像区域特征和文本单词特征，以减少冗余信息对图像区域和文本单词对齐的干扰；其次，通过语义相关性匹配模块，不仅利用局部匹配捕获局部显著对象之间的对应相关性，还把图像背景信息融入图像全局特征，利用全局匹配实现精确的全局语义相关性；最后，通过局部匹配分数和全局匹配分数获取图像和文本的最终匹配分数。实验结果表明，基于FESCM的图像文本检索方法在Flickr8k和Flickr30k基准数据集上的召回率总值比扩展的视觉语义嵌入方法分别提升了5.7和7.5个百分点，在MS-COCO数据集比双流层次相似度推理方法提升了3.7个百分点。因此该方法可以有效提高图像文本检索的准确度，实现图像与文本的语义连接。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

2. 基于注意力特征金字塔网络的肺结节检测算法

秦源源, 张鸿

《计算机应用》唯一官方网站 2023, 43 (7): 2311-2318. DOI: 10.11772/j.issn.1001-9081.2022060924

摘要（289）

HTML （6）

PDF （2687KB）（143）

针对肺结节计算机辅助检测（CAD）系统中肺结节形态各异难以检测带来的敏感度低、假阳性率高的问题，提出一种基于注意力特征金字塔网络的肺结节检测算法。在第一阶段，以更加紧凑的双路径网络（DPN）为骨干网络，并结合特征金字塔网络（FPN）进行多尺度预测，以获取不同层次的特征信息，同时嵌入全局注意力机制（GAM）来细化学习要强调的语义特征，并提高算法的敏感度；在第二阶段，提出一种假阳性抑制网络，以获得最终分类预测结果；在训练阶段，采用焦点损失函数和多种数据增强技术来处理数据不平衡问题。在公开数据集LUNA16 （LUng Nodule Analysis 2016）上的实验结果显示：仅有第一阶段的算法的竞争性能指标（CPM）达到了0.908，而加入假阳性抑制网络后算法的CPM达到了0.933，这与经典算法基于最大强度投影（MIP）的卷积神经网络（CNN）算法相比提升了1.1个百分点；而消融实验的结果表明DPN、FPN、GAM对于提升检测敏感度是有作用的。以上证明了所提出的两阶段检测算法可以获取多尺度结节信息，提高肺结节检测的敏感度，并且降低假阳性率。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

3. 基于双分支条件生成对抗网络的非均匀图像去雾

朱利安, 张鸿

《计算机应用》唯一官方网站 2023, 43 (2): 567-574. DOI: 10.11772/j.issn.1001-9081.2021122091

摘要（387）

HTML （16）

PDF （5800KB）（122）

雾天拍摄的图片存在颜色失真、细节模糊等问题，会对图片的质量造成一定影响。许多基于深度学习的方法虽然在去除合成的均匀雾霾图片上具有很好的效果，但在最新的NTIRE挑战赛中引入的真实非均匀去雾数据集上效果较差。主要原因是非均匀雾霾的分布较复杂，纹理细节在去雾过程中很容易丢失，并且该数据集的样本数量有限，容易产生过拟合。因此提出了一种双分支生成器的条件生成对抗网络（DB-CGAN）。其中，一条分支以U-net为基础架构，通过“加强-整合-减去”的策略在解码器中加入增强模块，从而增强解码器中特征的恢复，并使用密集特征融合为非相邻层级建立足够的连接。另一分支使用多层残差的结构来加快网络的训练，并串联大量的通道注意力模块，以最大限度地提取更多的高频细节特征。最后，使用一个简单有效的融合子网来融合两个分支。在实验中，所提模型在评价指标峰值信噪比（PSNR）和结构相似性（SSIM）上明显优于先前的暗通道先验（DCP）、一体化去雾网络（AODNet）、门控上下文聚合网络（GCANet）、多尺度增强去雾网络（MSBDN）去雾模型。实验结果表明，所提出的网络能够在非均匀去雾数据集上具有更好的性能。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

4. 基于多级语义的判别式跨模态哈希检索算法

刘芳名, 张鸿

计算机应用 2021, 41 (8): 2187-2192. DOI: 10.11772/j.issn.1001-9081.2020101607

摘要（319）

PDF （1091KB）（432）

针对大多数跨模态哈希方法采用二进制矩阵表示相关程度，因此无法捕获多标签数据之间更深层的语义信息，以及它们忽略了保持语义结构和数据特征的判别性等问题，提出了一种基于多级语义的判别式跨模态哈希检索算法——ML-SDH。所提算法使用多级语义相似度矩阵发现跨模态数据中的深层关联信息，同时利用平等指导跨模态哈希表示在语义结构和判别分类中的关联关系，不仅实现了对蕴含高级语义信息的多标签数据进行编码的目的，而且构建的保留多级语义的结构能够确保最终学习的哈希码在保持语义相似度的同时又具有判别性。在NUS-WIDE数据集上，哈希码长度为32 bit时，所提算法在两个检索任务中的平均准确率（mAP）比深度跨模态哈希（DCMH）、成对关联哈希（PRDH）、平等指导判别式哈希（EGDH）算法分别高出了19.48，14.50，1.95个百分点和16.32，11.82，2.08个百分点。

参考文献 | 相关文章 | 多维度评价

Select

5. 基于注意力机制网络的航运监控图像识别模型

张凯悦, 张鸿

计算机应用 2021, 41 (10): 3010-3016. DOI: 10.11772/j.issn.1001-9081.2020121899

摘要（233）

PDF （1343KB）（288）

针对已有的航运监控图像识别模型C3D里中级表征学习能力有限，有效特征的提取容易受到噪声的干扰，且特征的提取忽视了整体特征与局部特征之间关系的问题，提出了一种新的基于注意力机制网络的航运监控图像识别模型。该模型基于卷积神经网络（CNN）框架，首先，通过特征提取器提取图像的浅层次特征；然后，基于CNN对不同区域激活特征的不同响应强度，生成注意力信息并实现对局部判别性特征的提取；最后，使用多分支的CNN结构融合局部判别性特征和图像全局纹理特征，从而利用局部判别性特征和图像全局纹理特征的交互关系提升CNN学习中级表征的能力。实验结果表明，所提出的模型在航运图像数据集上的识别准确率达到91.8%，相较于目前的C3D模型提高了7.2个百分点，相较于判别滤波器组卷积神经网络（DFL-CNN）模型提高了0.6个百分点。可见所提模型能够准确判断船舶的状态，可以有效应用于航运监控项目。

参考文献 | 相关文章 | 多维度评价

Select

6. 基于三维卷积神经网络的航运监控事件识别

王中杰, 张鸿

计算机应用 2019, 39 (12): 3697-3702. DOI: 10.11772/j.issn.1001-9081.2019050916

摘要（345）

PDF （982KB）（288）

针对传统的机器学习算法对大数据量的航运监控视频识别分类的效果不佳，以及现有的三维（3D）卷积的识别准确率较低的问题，基于3D卷积神经网络模型，结合较为流行的视觉几何组（VGG）网络结构以及GoogleNet的Inception网络结构，提出了一种基于VGG-16的3D卷积网络并引入Inception模块的VIC3D模型对航运货物实时监控视频进行智能识别。首先，将从摄像头获取到的视频数据处理成图片；然后，将等间隔取帧的视频帧序列按照类别进行分类并构建训练集与测试集；最后，在保证运行环境相同并且训练方式相同的前提下，将结合后的VIC3D模型与原模型分别进行训练，根据测试集的测试结果对各种模型进行比较。实验结果表明，VIC3D模型的识别准确率在原模型的基础上有所提升，相较于组约束循环卷积神经网络（GCRNN）模型的识别准确率提高了11.1个百分点，且每次识别所需时间减少了1.349 s；相较于C3D的两种模型的识别准确率分别提高了14.6个百分点和4.2个百分点。VIC3D模型能有效地应用到航运视频监控项目中。

参考文献 | 相关文章 | 多维度评价

Select

7. 基于语义相关性与拓扑关系的跨媒体检索算法

代刚, 张鸿

计算机应用 2018, 38 (9): 2529-2534. DOI: 10.11772/j.issn.1001-9081.2018030553

摘要（900）

PDF （957KB）（382）

针对如何挖掘不同模态中具有相同语义的特征数据之间的内在相关性的问题，提出了一种基于语义相关性与拓扑关系（SCTR）的跨媒体检索算法。一方面，利用具有相同语义的多媒体数据之间的潜在相关性去构造多媒体语义相关超图；另一方面，挖掘多媒体数据的拓扑关系来构建多媒体近邻关系超图。通过结合多媒体数据语义相关性与拓扑关系去为每种媒体类型学习一个最优的投影矩阵，然后将多媒体数据的特征向量投影到一个共同空间，从而实现跨媒体检索。该算法在XMedia数据集上，对多项跨媒体检索任务的平均查准率为51.73%，与联合图正则化的异构度量学习（JGRHML）、跨模态相关传播（CMCP）、近邻的异构相似性度量（HSNN）、共同的表示学习（JRL）算法相比，分别提高了22.73、15.23、11.7、9.11个百分点。实验结果从多方面证明了该算法有效提高了跨媒体检索的平均查准率。

参考文献 | 相关文章 | 多维度评价

Select

8. 基于潜语义主题加强的跨媒体检索算法

黄育, 张鸿

计算机应用 2017, 37 (4): 1061-1064. DOI: 10.11772/j.issn.1001-9081.2017.04.1061

摘要（410）

PDF （732KB）（541）

针对不同模态数据对相同语义主题表达存在差异性，以及传统跨媒体检索算法忽略了不同模态数据能以合作的方式探索数据的内在语义信息等问题，提出了一种新的基于潜语义主题加强的跨媒体检索（LSTR）算法。首先，利用隐狄利克雷分布（LDA）模型构造文本语义空间，然后以词袋（BoW）模型来表达文本对应的图像；其次，使用多分类逻辑回归对图像和文本分类，用得到的基于多分类的后验概率表示文本和图像的潜语义主题；最后，利用文本潜语义主题去正则化图像的潜语义主题，使图像的潜语义主题得到加强，同时使它们之间的语义关联最大化。在Wikipedia数据集上，文本检索图像和图像检索文本的平均查准率为57.0%，比典型相关性分析（CCA）、SM（Semantic Matching）、SCM（Semantic Correlation Matching）算法的平均查准率分别提高了35.1%、34.8%、32.1%。实验结果表明LSTR算法能有效地提高跨媒体检索的平均查准率。

参考文献 | 相关文章 | 多维度评价

Select

9. 基于卷积神经网络和流形排序的图像检索算法

刘兵, 张鸿

计算机应用 2016, 36 (2): 531-534. DOI: 10.11772/j.issn.1001-9081.2016.02.0531

摘要（1076）

PDF （802KB）（1257）

针对基于内容的图像检索(CBIR)中低层视觉特征与用户对图像理解的高层语义不一致以及传统的距离度量方式难以真实反映图像之间相似程度等问题,提出了一种基于卷积神经网络(CNN)和流形排序的图像检索算法。首先,将图像输入CNN,通过多层神经网络对图像的监督学习,提取网络中全连接层的图像特征;其次,对图像特征进行归一化处理,然后用高效流形排序(EMR)算法对查询图像所返回的结果进行排序;最后,根据排序的结果返回最相似的图像。在corel数据集上,深度图像特征比基于场景描述的图像特征的平均查准率(mAP)提高了53.74%,流形排序比余弦距离度量方式的mAP提高了18.34%。实验结果表明,所提算法能够有效地提高图像检索的准确率。

参考文献 | 相关文章 | 多维度评价

Select

10. 基于深度特征分析的双线性图像相似度匹配算法

李鸣, 张鸿

计算机应用 2016, 36 (10): 2822-2825. DOI: 10.11772/j.issn.1001-9081.2016.10.2822

摘要（554）

PDF （770KB）（579）

基于内容的图像检索一直面临"语义鸿沟"的难题，特征选择对语义学习结果有着直接的影响；而传统距离度量方法往往从单一角度进行相似性计算，不能很好地表示出图像之间的相似度。为了解决以上问题，提出基于深度特征分析的双线性图像相似度匹配的方法。首先，将图像数据集在卷积神经网络模型上进行微调训练，然后利用训练好的卷积神经网络对图像进行特征提取，获得全连接层输出的特征之后，通过双线性相似性度量方法得到图像间相似度的大小，通过对相似度的大小排序，返回最相似的图像实例。在Caltech101和Caltech256数据集上的对比实验显示，所提算法的平均查准率、Top K查准率和查全率均优于对比算法，验证了所提算法的有效性。

参考文献 | 相关文章 | 多维度评价

Select

11. 拉格朗日支持向量回归的有限牛顿算法

郑逢德张鸿宾

计算机应用 2012, 32 (09): 2504-2507. DOI: 10.3724/SP.J.1087.2012.02504

摘要（1283）

PDF （502KB）（629）

拉格朗日支持向量回归是一种有效的快速回归算法,求解时需要对维数等于样本数加一的矩阵求逆,求解需要较多的迭代次数才能收敛。采用一种Armijo步长有限牛顿迭代算法求解拉格朗日支持向量回归的优化问题,只需有限次求解一组线性等式而不需要求解二次规划问题,该方法具有全局收敛和有限步终止的性质。在多个标准数据集上的实验验证了所提算法的有效性和快速性。

参考文献 | 相关文章 | 多维度评价

Select

12. 电力系统动态信息数据库关键技术

黄海峰张珂珩张鸿季学纯陈鹏

计算机应用 2011, 31 (06): 1681-1684. DOI: 10.3724/SP.J.1087.2011.01681

摘要（1130）

PDF （650KB）（10311）

在介绍了基于时间序列的动态信息数据库结构的基础上，结合电力系统数据特点，分析了并发数据处理、内存映射文件、磁盘缓存、关联数据存储等构建动态信息数据库的关键技术，并着重研究了数据采集流程和混合压缩算法。经实际应用案例表明，采用该关键技术构建的动态信息数据库满足了电力系统海量数据高速存储的要求。